@import tool.ReportPojo.ReportData
@import views.user.report.IndexTool._
@(resultPath: String, i: Int)(implicit data: ReportData)
<p class="paragraph">
	利用各个候选的代谢物浓度信息和分组信息分别绘制受试者工作特征曲线（Receiver operating characteristic curve，ROC），
	各个代谢物ROC曲线的曲线下面积（Area Under Curve，AUC）等结果见
	<a href="@(resultPath)Treatment/@(data.treats(i))/@(data.resultDatas(i).diagnoseDir)/04_Diagnose_Model_Generation/Logistic_Regression/Single_Met_ROC.csv">
		Single_Met_ROC.csv
	</a>
	<a href="@(resultPath)Treatment/@(data.treats(i))/@(data.resultDatas(i).diagnoseDir)/04_Diagnose_Model_Generation/Logistic_Regression" target="_blank"><span class="fa fa-folder-open"></span></a>

	，各个代谢物单独进行预测的ROC曲线见
	<a href="@(resultPath)Treatment/@(data.treats(i))/@(data.resultDatas(i).diagnoseDir)/04_Diagnose_Model_Generation/Logistic_Regression/Single_Met_ROC.pdf" target="_blank">
		Single_Met_ROC.pdf
	</a>
	<a href="@(resultPath)Treatment/@(data.treats(i))/@(data.resultDatas(i).diagnoseDir)/04_Diagnose_Model_Generation/Logistic_Regression" target="_blank"><span class="fa fa-folder-open"></span></a>
	。
</p>
<p class="paragraph">
	为了从这些候选差异代谢物中寻找有潜力的生物标志物，我们对各个差异代谢物依次执行了随机森林（Random Forest，RF）、支持向量机（Support Vector Machine，SVM）和Boruta分析。
</p>
<p class="paragraph">
	Boruta是一种基于RF的特征选择方法，选择相比随机滞缓特征具有更显著区分能力的关键特征。最大运行次数为1000次。当包含暂定特征时，我们会进行二次选择，以判断某些波动较大的代谢物是否要被纳入被选择的特征。Boruta结果中，标注为已确认（“Confirmed”）的代谢物即为最终筛选得到的用于后续构建模型的生物标志物。这些生物标志物会使用Gradient Boosting、Logistic Regression和Random Forest法进行建模预测。建模后，通过绘制受试者工作特征曲线（Receiveroperatingcharacteristiccurve，ROC）曲线和精确率召回率（Precision Recall Curve）曲线，计算敏感性和特异性数值，以评估模型效果。
</p>

